昨天有講解機器學習、深度學習、人工智慧的關係介紹,今天我們來深入介紹深度學習的運作原理吧。深度學習主要是機器學習的分支,基於機器學習的演算法,延伸發展出人工神經網路,人藉由感知(手、眼睛、耳朵、口...),將感受到的訊息藉由「神經」,傳遞給大腦做判斷,將大腦所做的判斷藉由神經,傳達至器官上;人工神經網路運作流程如下圖:
深度學習是機器學習(Machine learning)的一個分支,希望把資料透過多個處理層(layer)中的線性或非線性轉換(linear or non-linear transform),自動抽取出足以代表資料特性的特徵(feature)。
引用於周秉誼 / 趨勢科技 技術經理:http://www.cc.ntu.edu.tw/chinese/epaper/0038/20160920_3805.html
根據前面的講解,可以大致的了解,深度學習的類神經網路學習,是模仿人類的神經網路,我們以下圖來講解模擬的過程,而深度學習是如何轉換成數學公式來運作:
上圖,X1、X2、X3分別代表接收到訊息的神經元,將各個收到的資料呈上各個資料的權重,將總成B1,要將彙整好的B1資料就需要activate function來模擬神經元傳導,而常見的activate finction通常為非線性函數,例如:sigmoid、relu(Rectifier Linear Unir,ReLU)
圖片引用於:https://cdn-images-1.medium.com/max/1600/1*XxxiA0jJvPrHEJHD4z893g.png
依據上圖我們可以看到sigmoid function,當Z值大約 Z<(-6)和Z>(4)時,sigmoid(z)為處於'0'/'1',資料只有在Z值為-6~4之間,才會有反應,這就好像人體的神經一樣,當周遭的味道沒有這麼厚重的時候,感官傳遞給大腦的資訊為沒有味道(Z<-6),當人體改覺到周遭的味道時(Z值為-6~4時),神經傳遞給大腦的資訊開始有了變化,當氣味越來越重,時間越來越久,大腦就會習慣處在這個環境下Z>(4)。